大数据时代变革的平民化
古时候数字出现之前,古人就已经有了数的概念,并且通过石头等最简单的方式来记录,成为彼此沟通的一种方式。通过对古人计数方式的研究发现,事实上,那时就已经有了大数据思想以及通过统计分析的基本概念。古人也会通过调查活动来收集数据,这些都说调查数据的早期形态。随着数字的出现,数据对于人们的生活、工作以及社会交往产生了重大的影响,成为决策的重要依据。随着抽样技术的进步,人们逐渐学会了通过统计调查的方式来系统性收集数据,并且形成了一套系统性数据收集方法,数据质量有了保障,调查数据的权威性获得了社会的认可。数据科学的不断发展与完善,大数据开始崛起,并且对于当今社会的影响与日俱增,人类进入了所谓的“大数据时代”。身处这个时代,自然会在工作和生活中遇到各种各样的数据,如何能够正确认识这些数据并从中发现有价值的信息,就是这个时代人们普遍面临的问题。数据科学的发展,一方面推动了调查数据的科学性和可靠性,另一方面又催生了大数据的出现和兴起。这两类数据是当今社会运行过程中重要的支撑,成为了人们决策的重要依据。科学认识这两类数据,有助于人们把握好这些数据的特征和优劣势,依据具体的决策情景合理有效利用这些数据。数据科学的发展,也正在深层次改变着人们的生活与工作方式,甚至改变着人们的思维模式,使得世界更加趋于扁平化和民主化。
身处大数据化社会之中,人们一方面时时刻刻在生产着各种类型的数据,另一方面同时有无时无刻在接受各式各样的数据和信息。为了帮助人们应对洪水般的信息,数据库管理系统应运而生,而且数据库技术不断进步和完善,成为了数据时代的重要技术支柱。因为有了数据库,各种数据的存储和分享变得更为便捷和容易,广大社会大众才能够更容易接触到各种数据。当然,从更高的哲学高度来看,数据库不仅仅是处理人们社会活动中所出现的一切数据,还是与宇宙的运行有着密切的关系。著名的物理学家尼古拉·特斯拉有一句名言说:“宇宙空间中存在着一个神秘的数据库。”这是从宇宙运行的高度来看数据库,认为宇宙运行的过程中都会时时刻刻产生数据,而在整体上,这些数据都是互相关联并按照一定规则和秩序进行保存和调用,所以,宇宙本身就是最高等级的数据库。这句话深深感染了埃隆·马斯克。所以,当埃隆·马斯克在2003年硅谷创立电动汽车公司时,就命名为“特斯拉”。在发明创造上,埃隆·马斯克的确与尼古拉·特斯拉有几分相识之处。
蒂姆·伯纳斯·李爵士
当然,数据民主化的过程并非是一帆风顺的。2012年伦敦奥运会开幕式上,万维网的发明者蒂姆·伯纳斯·李爵士亮相,并打出了“This is for Everyone”字样,言外之意,互联网献给所有人。事实上,蒂姆·伯纳斯·李爵士不仅仅是互联网之父,还是数据民主化的斗士。2009年3月,他利用一次科学年会上演讲的机会,呼吁政府公开数据,并带领台下的听众一起喊口号“原始数据!现在就要!”后来,他成为英国政府内阁的高级顾问,力主推动英国政府数据公开活动,但是他四处碰壁,遭遇到了难以想象的阻力。所幸的是,他并未就此放弃,而是愈挫愈勇,通过四处游说的方式去争取支持。最终,在2010年1月,英国政府正式启用数据门户网站。之后,英国政府承认“数据权(Right to Data)”,认为这是大数据时代一项基本的公民权利,并承诺会继续向全社会开放更多的数据。从一定意义上来说,这场争取“数据权”的运动,可以与英国历史上的“光荣革命”相媲美,这是数据民主化进程中的一次重大胜利。在英国的影响之下,美国政府也开始跟进,陆续向社会开放了政府数据。随着世界各国数据开放运动的持续发展和不断深入,数据民主化已经成为了各国政府的一种共识。在中国,李克强总理曾经强调说:“目前我国信息数据资源80%以上掌握在各级政府部门手里,’深藏闺中’是极大浪费。”可见,数据民主化的过程,也是数据价值被更好利用的过程。
在博弈论中,有个经典的例子,就是所谓的“囚徒困境”。在信息不对称情况下,陷入困境的囚徒往往开启的是非零和博弈,个人的最佳选择并非是团体最佳选择。造成这种局面的根本原因是信息无法共享,若能够共享,则很自然会获得团体和个人的最佳均衡解。不一定非要被抓到监狱关起来的是囚徒,现实生活中同样有大量的不在监狱中的囚徒。柏拉图有个著名的“洞穴说”,住在洞穴中的人都被称为“洞穴囚徒”。这些洞穴囚徒所看到的只是后壁上的投影,没看过真实世界的样子,相互之间的交谈也不会导致怀疑的结果,只会对墙上的影子信以为真,以为这就是真实本身。其中有些洞穴囚徒会走出洞穴,看到外面真实的世界,但最终还是愿意走回洞穴当囚徒。无论是博弈论中的“囚徒困境”还是“洞穴囚徒”,都有一个共同的因素,就是信息的不对称性。造成信息的不对称,有两方面原因,其一就是“囚徒困境”中的外部隔绝,导致彼此无法共享信息;其二就是“洞穴囚徒”中的对于信息解释上的偏见,导致见面拥有足够的信息而无法正确解释这些信息,结果就是形成错误的判断。这也是当今数据时代所容易出现的情形,要么没有收集到想要的数据,要么在分析和解释数据的过程中出现了问题。
从某种意义来说,发展至今的数据科学都在试图更好地解决上述这两个问题。在试图解决这些问题的过程中,调查数据和大数据获得了蓬勃的发展,为人类摆脱“囚徒”的角色提供了可能。数据的发展过程,具有一定的社会性。最初,数据往往被精英层所掌握,这些精英层包括政治人物、学者和社会意见领袖等。为了确保自身的利益,这些精英层会严格限制数据的扩散层度,甚至操控数据以达到私人目的。在古希腊,只有贵族才能够掌握包括奴隶、土地、屋舍等数据,对于数据的掌握权是那时候贵族特权之一。随着科技的发展,数据收集的成本大大降低,数据开始了去贵族化的征途,现在几乎每个人都时时刻刻可以接触到大量的数据。过去,想要知道自己在哪里或者别人在哪里,需要费很大力气。现在,只要有个智能手机,就可以轻而易举地获得这些数据。过去,做一个调查要花费很大人力、物力和财力,现在用手机或者在网络上做调查,很快就可以收集到大量的调查数据。数据的普及化以及平民化,推动了社会的平民化,所谓的数据特权在消失。现在不是数据被少数人所掌握,而是数据的泛滥。各种各样的数据,每天都飞速地在社会中、在各种圈子里流传,容易造成数据过载的困扰。当然,这可能也是数据平民化过程中所不可避免的发展阶段。
《全数据时代的炼金师》从大数据对于现代社会的冲击和影响、调查数据在社会决策中的地位演变、大数据崛起的过程以及所带来的社会影响和意义、数据融合的机制和力量、数据融合和共生的意义以及在现实社会中的应用、全数据模式及其社会意义和价值6个方面来进行系统性的研究。探讨大数据和调查数据在现实社会中的妙用,便于人们全面认识各种类型数据的基本特征以及数据融合的作用和力量,提高人们对于数据利用的能力。
书号:978-7-115-45184-2
日期:2017年3月
开本:16开
定价:49元
顾佳峰
北京大学中国社会科学调查中心科研发展部主任、副研究员
北京大学创新研究院副院长
美国加州大学伯克利分校、哈佛大学高级访问学者
北京大学光华管理学院学士、硕士和博士
北京大学教育学院公共管理博士后
经济合作与发展组织“产业监管调查项目”中国地区首席科学家
已出版五部学术专著:《教育机构战略性服务研究》《中国教育资源非均衡配置研究——空间计量分析》《调查机构管理:理论与实践》《调查机构公共关系经营与管理》和《减少不平等与可持续发展》,还出版了一部管理类畅销书《达观天下:跟尹衍梁学管理》,在Higher Education、Studies in Higher Education、Asia Pacific Education Review、Applied Spatial Analysis and Policy等国际SSCI期刊上独立发表数篇论文,并被聘为其评审人;在《经济研究》《社会学研究》等核心期刊及报纸上共发表中文论文80多篇。主持或参与国家自然科学基金项目、教育部重大人文基地项目、经济合作与发展组织项目、麻省理工国际项目等二十多项。2006年以来,负责中国首个大规模社会跟踪调查——中国家庭追踪调查(China Family Panel Studies,CFPS)的设计、执行等工作。
图书名人推荐语
顾佳峰的创作为我们提供了全数据时代智慧的惊鸿一瞥。经由此书,大数据可以转化为真知,可以是为人所用、具有行动力的信息。不得不说,这是一部卓越而意义非凡的著作。
——哈佛大学教授,美国科学院院士,图灵奖得主 莱斯利·瓦伦特
《全数据时代的炼金师》是一部融合了大数据和深层数据的独一无二的宝贵著作。它向我们展示了作者收集各个领域知识和信息的能力以及如何运用数据分析领域的专业知识来提升大数据的价值。在无数方法中,这是唯一一种能实现让数据改变国家政策及我们社会生活的可行方式。
——全球畅销书《链接》和《爆发》的作者 艾伯特-拉斯洛·巴拉巴西
顾老师的新书,收容了古今中外许多大数据应用的例子,既引人启发,又更完整的叙述了大数据在各行各业能产生的效果。对学生,数据科学家,和企业领导都有参考的价值。
——微软亚洲研究院副院长 张益肇
这是一个大数据的时代,也是大数据与调查数据融合的时代。数据科学让我们越来越多从数据中观察到人类社会的复杂行为模式。数据知识的掌握,数据思维方式的养成需要一个系统的学习过程。顾老师倾心撰写的《全数据时代的炼金师》一书相信能够帮助读者培养更全面的数据认知,开启认识数据世界的大门,相信有更多精彩等待着您。
——中国传媒大学新闻学院教授,中国市场研究行业协会会长 沈浩
长按下方任意二维码,即可优惠购买此书!
图书出版投稿、合作电话和邮箱
唐老师
010-81055448
文中部分图片来源于网络